先前关于安全加强学习的工作(RL)研究了对动态(aleatory)随机性的风险规避,并隔离地模拟了不确定性(认知)。我们提出并分析一个新框架,以共同对有限马和折现的无限马MDP中的认知和差异不确定性相关的风险进行建模。我们称此框架结合了规避风险和软性的方法RASR。我们表明,当使用EVAR或熵风险定义风险规定时,可以使用具有时间依赖性风险水平的新的动态程序公式有效地计算RASR中的最佳策略。结果,即使是在无限 - 亨特折扣环境中,最佳的规避风险政策也是确定性但依赖时间的。我们还表明,具有平均后验过渡概率的特定RASR目标减少到规避风险的RL。我们的经验结果表明,我们的新算法始终减轻EVAR和其他标准风险措施衡量的不确定性。
translated by 谷歌翻译
太阳耀斑不仅对外层空间的技术和宇航员的健康构成风险,而且还会在我们的高科技,相互联系的基础设施中造成破坏我们的生活。尽管已经提出了许多机器学习方法来改善耀斑预测,但据我们所知,它们都没有研究过异常值对可靠性和这些模型的性能的影响。在这项研究中,我们研究了异常值在多元时间序列基准数据集中的影响,即天鹅 - SF对耀斑预测模型,并检验我们的假设。也就是说,Swan-SF中存在异常值,将其删除增强了看不见的数据集上预测模型的性能。我们采用隔离森林来检测弱耀斑实例之间的异常值。使用大量污染速率进行了几项实验,这些污染速率确定了当前异常值的百分比。我们使用LimeseriessVC来评估每个数据集的实际污染质量。在我们最好的发现中,我们的真实技能统计数据增加了279%,海德克技能得分提高了68%。结果表明,如果检测到并正确删除异常值,总体上可以取得重大改进来爆发预测。
translated by 谷歌翻译